Detecting Protest Events Using Pre-trained Language Model
Full-time Lecturer
Graduate School of Arts and Sciences, The University of Tokyo
kazuhiroterashita@outlook.jp
2025-06-29
社会運動の規模や暴力性、採用する戦術 (McAdam and Su 2002; Fassiotto and Soule 2017)
メディアの注目度 (Madestam et al. 2013; Hunt and Gruszczynski 2019; Andrews and Caren 2010)
政治的機会構造
動員に比べると研究が進んでいない (Amenta et al. 2010)
抗議行動を全て把握したデータベースは存在しない (Jenkins and Maher 2016)
伝統的には新聞記事の手作業コーディングによって特定
機械学習を用いた自動化・半自動化
newsmapを利用 (Watanabe 2018)seededldaを利用 (Watanabe and Baturo 2023)BIGKindsを用いて新聞記事を収集
2000年1月1日〜2022年12月31日
重複や国際面を除いた205,931記事を収集
| 記事本文 | 抗議 | 地理 | レパートリー | 主張 |
|---|---|---|---|---|
| 泗川市三千浦遊覧船協会(理事長イ·サムス)は29日午前10時、三千浦庁舎の正門で100人余りの会員と家族が参加した中、泗川市議会の観光支援施設敷地造成事業費の予算全額削減を糾弾するデモを行った… | 関連あり | 泗川市 | デモ | 開発 |
| 北済州郡は29日、農漁民文化体育センターの着工式を行い、本格的な建築作業に入った(中略)このセンターには展示、集会、公演及び体育活動ができる多目的室と主婦教室などがある.. | 関連なし | 済州市 | — | — |
| Model | Accuracy | Recall | F1 Score |
|---|---|---|---|
| Naive Bayes | 0.72 | 0.69 | 0.65 |
| Random Forest | 0.70 | 0.71 | 0.76 |
| XLM-RoBERTa | 0.72 | 0.70 | 0.70 |
分析手法:「説明変数」を結果変数、操作変数候補を説明変数にした回帰分析
分析単位:日×基礎自治体および2018年地方選挙 *ソウルなど都市は広域
結果変数:先述の手法で特定した抗議行動
説明変数:降水量と気温
| RF-Protest | RF-Report | RF-Clash | |
|---|---|---|---|
| + p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001. | |||
| 都市圏(都道府県)レベルでクラスタリングされたロバスト標準誤差。 | |||
| RF = Random Forest | |||
| Rainfall | -0.000 | -0.000 | -0.000 |
| (0.000) | (0.000) | (0.000) | |
| Temp_dev | 0.000 | 0.000 | 0.000 |
| (0.000) | (0.000) | (0.000) | |
| Num.Obs. | 294417 | 294417 | 294417 |
| R2 | 0.270 | 0.226 | 0.031 |
| RF-Protest | RF-Report | RF-Clash | |
|---|---|---|---|
| + p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001. RF = Random Forest | |||
| 都市圏(都道府県)レベルでクラスタリングされたロバスト標準誤差。 | |||
| (Intercept) | -0.672 | 0.834 | 0.100 |
| (1.653) | (1.285) | (0.102) | |
| Rainfall | 0.029 | 0.055 | 0.007 |
| (0.054) | (0.065) | (0.007) | |
| Temp_dev | 0.032 | -0.042 | -0.005 |
| (0.080) | (0.062) | (0.005) | |
| Num.Obs. | 160 | 160 | 160 |
| R2 | 0.007 | 0.006 | 0.016 |
| RF-Protest | RF-Report | RF-Clash | |
|---|---|---|---|
| + p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001. 曜日ダミーを投入 | |||
| Rainfall | -0.000 | -0.000 | -0.000* |
| (0.000) | (0.000) | (0.000) | |
| Temp_dev | 0.000 | 0.000 | 0.000+ |
| (0.000) | (0.000) | (0.000) | |
| I(Temp^2) | -0.000 | -0.000 | 0.000 |
| (0.000) | (0.000) | (0.000) | |
| Num.Obs. | 294417 | 294417 | 294417 |
| R2 | 0.262 | 0.218 | 0.024 |
日本比較政治学会第28回大会@オンライン